时政
财经
科技
虚拟货币
其他
登录
#Gemini 2.5 Flash Image
关注
向阳乔木
1个月前
谷歌“Nano Banana”名字源于早模型漏洞。 会导致模型在图像中意外插入香蕉。 一开始匿名登陆LMArena,被大家发现质量过于牛x,影响太大。 后谷歌承认是自家模型,虽然命名为Gemini 2.5 Flash Image,但大家还是习惯于叫Nano Banana。
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#谷歌
#nano banana
#Gemini 2.5 Flash Image
#模型漏洞
#LMArena
分享
评论 0
0
池建强
1个月前
这事你还没注意呢,巨无霸已经完成“反超时刻” 过去两年世界的主旋律就是 AI 行业,AI 行业的主旋律和明星公司自然是 OpenAI 的 GPT 了。无论是模型能力,发布节奏,还是产品化速度,品牌深入人心的影响力,GPT 一枝独秀,虽然说前三名是 OpenAI、Google 和 Anthropic,对应的模型就是 GTP、Gemini 和 Claude,但大家普遍的心智还是,二三名和第一,有代际差距,至少是落后几个月的身位。 我记得 AI 搜索流行的时候,国外同行都有共识,这事对 Google 影响最大,当 Perplexity 宣布用 AI 搜索颠覆 Google 的时候,这个巨无霸是否在瑟瑟发抖呢? 看起来并没有。 DeepMind 作为 Google 内部最具创新力的团队之一,很早就在基础模型、推理能力、跨模态理解等领域深耕多年。许多技术突破和算法优化,悄摸早就用在 Google 的各条产品线上了,只是大多数人并未察觉。 等到 Gemini 2.5 Flash Image 发布的那一刻,才让人意识到,Google 并不是慢了一步,而是在等待一个合适的时机,这个时机甚至不是自己创造的或者 Google 营销的,而是产品自身带来的引爆点。 DeepMind 的积累和 Google 的产品能力,最终在这场 AI 的竞赛中实现了“暗中提速”,也让外界对 Google 的判断出现了偏差。 如果说之前大家还在讨论“谁的模型跑得更快”,那么现在,Google 给出的答案是:不止快,更聪明。 并且 Nano Banana(Gemini 2.5 Flash Image的模型代号)的速度真心不慢。上周只是生图的速度快,当时我还觉得这质量不如 GPT 啊。今天试了一下,生成的图片质量已经不分伯仲了: Google DeepMind 视觉生成产品负责人 Nicole Brichtova 在谈到这一代模型时,用了“质的飞跃”来形容。 她认为,不论是图像生成,还是后续的编辑,Gemini 2.5 Flash Image 已经达到了业内的新高度。而这确实是用户亲身体验后才能感受到的震撼。 1、一致性与自然交互 这代模型最令人惊讶的地方,在于它解决了长期困扰生成式 AI 的“连续性”问题。 以往的图像生成工具,如果你要求它“换个角度”或者“换件衣服”,往往会生成一张完全不同的人物,就像在描述另外一个角色。 而 Gemini 2.5 Flash Image 的特性是:它能在多轮自然语言交互中保持角色高度一致,这周我又试了试,一致性正在变得越来越好。 你可以换动作、换服装、甚至换场景,但画面里的那个人,依然是“同一个人”。这对于创意产业、品牌设计乃至虚拟 IP 的构建,都是革命性的。 更妙的是,这种交互方式不再是“冷冰冰的参数和命令”,而是接近人类自然对话的体验。模糊的表达、自由的提示,甚至一句极简的“再来一张”,模型都能理解并产出符合预期的结果。 2、从“生图”到“对话” 回想一下上周,我还觉得 nano banana 这样的模型和 GPT 之间的差距明显,而短短一周后,差距就很难分辨了。 模型的进化速度,就像火箭一样,一次次把人类的想象推向更远的地方。 过去我们谈 AI 图像生成,用的是“生图”这个词,意味着它像摄影一样,一次性生成一张图。现在,Gemini 2.5 Flash Image 的体验,更接近一种“对话”。 你和它说话,它理解上下文,持续生成;你提出修改,它保留一致性,灵活调整。模型的“聪明程度”第一次让人觉得,它不仅仅是一个工具,而更像一个合作者。 Nicole Brichtova 在采访时说过另一句话:“我们现在看到的,只是这些模型潜力的冰山一角。” 是图像生成、角色一致性和自然语言驱动的突破,但在这些能力背后,真正令人期待的是 AI 原生的交互范式。当模型具备了跨模态的语义理解能力,它就不再局限于“输入-输出”,而是可以持续陪伴用户,完成更复杂的创作任务。这可能是一次范式转移。 在 AI 时代有个和以前非常不一样的现象:纯工具没什么护城河,留给创业者的时间差非常小。很多创业公司基于之前大模型做出来的工程化产品,一旦新模型出来,你的工程化能力,直接就被新模型碾压了,这是个巨大的创业鸿沟。 比如你之前基于 GPT 的 API 搞了很多工程化的算法保证角色一致性做了一个绘图工具,现在 Nano Banana 出来,你的产品立刻就会被抛弃了。用户不会有忠诚度的。 但剪映这样的工具肯定不会抛弃,对吧?因为剪映做的工程化,大模型是做不了或不愿意做的。 如何重新思考并建立自己的用户群和核心机制,这是创业公司必须要考虑的事。 Gemini 2.5 Flash Image 的发布,标志着 AI 进入了一个新的阶段。角色一致性、自然对话式生成和高质量的图像编辑,已经让我们看到了未来的影子。 但有一点可以肯定:AI 领域的竞争不再是单点的功能对比,而是生态、交互和用户体验的全面较量。
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Gemini 2.5 Flash Image
#AI 图像生成
#角色一致性
#自然语言交互
#DeepMind
分享
评论 0
0
-Zho-
1个月前
🍌nano-banana 妆面分析 + 优化建议! 这可以直接做成小应用了吧(就看能不能满足姐妹们的实际需求了 ZH25O|创意系列|Gemini 2.5 Flash Image 【Prompt】⬇️
#nano-banana 妆面
#ZH25O
#Gemini 2.5 Flash Image
#妆面分析
#优化建议
分享
评论 0
0
池建强
1个月前
随着纳米香蕉风暴席卷全球,“火爆程度高于同期 GPT-4o”、“短时间内在 LMArena 等平台登顶”、“单日百万级互动量”,这些传说在 X 上广为流传。你看看,模型好 Google 就能瞬间翻盘。晚上总结了一下 Google 最新的顶级 AI 工具,有兴趣的都可以试试。事半功倍。 1、NanoBanana(Gemini 2.5 Flash Image) Google 最新的 AI 图像编辑工具,可通过文本提示实现高度一致的图像变换与本地精细编辑。已集成进 Gemini,是当前评价最高的图像编辑AI之一,适用于产品、时尚、社交等多种图片生成与修改场景。 访问入口: 或在 Gemini 应用内使用。 2、Flow(Google AI 电影制作工具) 该工具集成 Veo 3、Imagen 和 Gemini,创作者可通过自然语言提示快速生成电影级场景和故事,有助于影视创作和内容生成。 访问入口:,也可通过官方说明了解更多。 3、Veo 3(AI 视频生成器) Google 最新一代视频生成器,支持从文本、图片或片段生成高质量的视频,并具备逼真的视觉、动作、音频同步等功能,适合创作者和教育人士。 访问入口: 4、NotebookLM(AI 数字笔记/文档助手) 一款 AI 赋能的文档工具,能帮你快速分析文档、提炼要点并生成总结,现在还支持将多语种笔记直接做成视频演示,非常适合学术与内容创作者。 访问入口: 5、Gemma 3(杰玛3)开源大模型 这是 Google 基于 Gemini 2.0 技术推出的多模态开源 AI 模型系列,可以在个人电脑、云和移动端运行,支持 140 多种语言、文本、图片等输入,适合学术、开发和商业各种应用。官方支持 HuggingFace、Kaggle 下载以及 Vertex AI 接入。 访问入口:Gemma 3 官方页|开发文档/AI Studio|Vertex AI 模型库 5、Project Mariner(谷歌 AI 浏览器代理/自动化助手) 这是 Google 推出的下一代网页自动化智能体,可理解网页文本和视觉元素、在浏览器里自动完成多步任务(如内容抓取、填写表单、自动比价/搜索等),支持复杂的跨网页操作,目前 Ultra 订阅用户可率先体验,未来会集成进 Gemini Agent 模式。 访问入口:Google Labs 演示页面|官方介绍 金秋九月,终于来了,2025,还剩四个月。 2025年9月1日
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#纳米香蕉风暴
#Google AI工具
#Gemini 2.5 Flash Image
#AI电影制作
#开源大模型Gemma 3
分享
评论 0
0
歸藏(guizang.ai)
1个月前
谷歌在 AI Studio已经把 Gemini 2.5 Flash image的名字改成了 Nano Banana,确定按钮都改成黄色了,真会整活 模型代号取代原本名字的模型这也是第一个了
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Gemini 2.5 Flash Image
#nano banana
#谷歌 AI Studio
#模型代号
#黄色按钮
分享
评论 0
0
sitin
1个月前
Google 推出 Gemini 2.5 Flash Image 模型,主打原生图像生成与编辑功能,官方称其技术为"state-of-the-art"并排名全球第一,向所有用户免费开放,支持通过 Gemini App 和 Google AI Studio 访问。 核心功能特性 支持上传3张图片并融合创意元素 人像风格转换保持主体特征(如自拍优化) 文本添加、背景替换与主体修改 生成内容需遵守Google内容政策,禁止侵权使用 图像处理的技术优势 高效架构:尽管模型体积更小,但它采用了与 Gemini 2.5 Pro 相同的突破性 混合专家(Mixture-of-Experts, MoE) 架构。 这意味着它只针对特定任务激活神经网络中最相关的部分,使得图像处理速度极快、效率极高。 超长上下文窗口:它支持实验性的 100万token 上下文窗口。虽然单张图片用不到这么多,但这允许您在单个提示中处理数十张图片或长视频,并对整个集合进行提问和分析。 访问方式与配置 Gemini App:选择"2.5 Flash"模型(标注"Fast all-around help") Google AI Studio:选择"Gemini Native Image"功能模块,需科学上网环境,当前因用户量大存在卡顿现象 使用限制 风格转换功能稳定性不足,部分效果需多次尝试 高峰期访问存在服务器拥堵问题 所有生成内容需遵守Google安全政策与版权规定
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Google
#Gemini 2.5 Flash Image
#图像生成
#免费开放
#AI Studio
分享
评论 0
0
大帅老猿
1个月前
创下新纪录!用 Gemini 2.5 Flash Image(Nano Banana)软件将 13 张图片合并成一张图片。这拼贴方法简直太牛了!我真的很惊讶它能做到这样,不过我觉得我已经达到极限了,即使只有 13 个元素,它仍然能够保持一致性。不过,一旦你开始尝试这种海量元素,详细的提示就显得尤为重要了。🤯 提示:一位模特正靠在一辆粉色宝马上摆姿势。她穿着以下物品,场景背景为浅灰色。绿色外星人是一个钥匙扣,挂在粉色手提包上。模特肩上还有一只粉色鹦鹉。旁边坐着一只戴着粉色项圈和金色耳机的哈巴狗。
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Gemini 2.5 Flash Image
#图片合并
#粉色宝马
#粉色鹦鹉
#哈巴狗
分享
评论 0
0
Gorden Sun
1个月前
nano banana(Gemini 2.5 Flash Image Preview)的免费使用途径: 1、AIStudio 2、Gemini APP(左上角切换模型) 3、Whisk 4、Opal 自己搭建工作流,里面可以选2.5 Flash Image,也能免费用Veo 3 5、OpenRouter
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#nano banana
#Gemini 2.5 Flash Image
#免费使用
#Aistudio
#Veo 3
分享
评论 0
0
sitin
1个月前
今天试了 Google 最新的图像生成功能——“Nano-Banana”(又名 Gemini 2.5 Flash Image)。 能把一张普通照片做出很细腻的多步编辑,细节挺惊艳的,干掉PS 的存在。 我刚刚看 replicate 已经有这个模型 api 了,大家可以去接入用到自己的网站去。 访问方式与配置 Gemini App:选择"2.5 Flash"模型(标注"Fast all-around help") Google AI Studio:选择"Gemini Native Image"功能模块,当前因用户量大存在卡顿现象 一些局限性 风格转换功能稳定性不足,部分效果需多次尝试 高峰期访问存在服务器拥堵问题
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Google
#Gemini 2.5 Flash Image
#图像生成
#AI Studio
#卡顿
分享
评论 0
0
歸藏(guizang.ai)
1个月前
开个帖子记录一下 Gemini 2.5 Flash Image 模型我发掘的一些用法,会持续更新,建议收藏 首先这个模型支持多图参考,为了你提示词好写,你可以给多张图片加上标记 比如这里就是 A 的背景、B 的沙发以及 C 的人物
Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 559 条信息
#Gemini 2.5 Flash Image
#多图参考
#A的背景
#B的沙发
#C的人物
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞